花费 100 ms
增强学习(二)----- 马尔可夫决策过程MDP

1. 马尔可夫模型的几类子模型 大家应该还记得马尔科夫链(Markov Chain),了解机器学习的也都知道隐马尔可夫模型(Hidden Markov Model,HMM)。它们具有的一个共同性质就 ...

Tue Jan 14 08:21:00 CST 2014 19 80193
一步步教你轻松学K-means聚类算法

一步步教你轻松学K-means聚类算法 ( 白宁超 2018年9月13日09:10:33) 导读:k-均值算法(英文:k-means clustering),属于比较常用 ...

Thu Sep 13 17:13:00 CST 2018 0 17165
数据挖掘十大经典算法

一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策 ...

Mon Jul 27 02:41:00 CST 2015 0 35694
增强学习(四) ----- 蒙特卡罗方法(Monte Carlo Methods)

1. 蒙特卡罗方法的基本思想 蒙特卡罗方法又叫统计模拟方法,它使用随机数(或伪随机数)来解决计算的问题,是一类重要的数值计算方法。该方法的名字来源于世界著名的赌城蒙特卡罗,而蒙特卡罗方法正是 ...

Sat Feb 22 22:06:00 CST 2014 2 42484
增强学习(三)----- MDP的动态规划解法

上一篇我们已经说到了,增强学习的目的就是求解马尔可夫决策过程(MDP)的最优策略,使其在任意初始状态下,都能获得最大的Vπ值。(本文不考虑非马尔可夫环境和不完全可观测马尔可夫决策过程(POMDP)中的 ...

Mon Jan 20 18:26:00 CST 2014 9 33816
增强学习(一) ----- 基本概念

机器学习算法大致可以分为三种: 1. 监督学习(如回归,分类) 2. 非监督学习(如聚类,降维) 3. 增强学习 什么是增强学习呢? 增强学习(reinforceme ...

Sun Jan 12 05:44:00 CST 2014 0 33787
对TPR(真正例率) 与 FPR(反正例率)的理解

将测试样本进行排序,“最可能”是正例的排在最前面,“最不可能”是正例的排在最后面。 分类过程就相当于在这个排序中以某个“截断点”(见图中阈值)将样本分为两部分,前一部分判作正例,后一部 ...

Wed Oct 17 17:51:00 CST 2018 1 8566
决策树J48算法

1、J48原理   基于从上到下的策略,递归的分治策略,选择某个属性放置在根节点,为每个可能的属性值产生一个分支,将实例分成多个子集,每个子集对应一个根节点的分支,然后在每个分支上递归地重复这个过程 ...

Sat May 23 20:45:00 CST 2015 0 11253

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM